معرفی الگوریتم برت
سوم آبان،25 اکتبر گوگل خبری منتشر کرد و گفت که الگوریتم برت BERT که الگوریتم جدید است را فعال کرده است. این خبر در بلاگ گوگل آمد و البته توضیحات خوبی هم درباره آن بیان شد. لینک بلاگ گوگل را در قسمت منابع ما ببینید. در خبر امروز میخواهیم درباره چند و چون این الگوریتم نسبتا جدید صحبت کنیم. در دپارتمان سئو نوین مارکتینگ برای بررسی این الگوریتم و تأثیر آن بر روی سرچها و نتایج جستجوها کار میکنیم. اما تا الان تأثیر بسیار زیادی در نتایج رتبهها فارسی مشاهده نشده است. پس فعلا میتوانیم یک نفس راحت بکشیم؛ البته فعلا.
گوگل برای توضیح الگوریتم برت این گونه میگوید: این الگوریتمی برای پردازش زبان طبیعی Natural Language Processing ) NLP) این الگوریتم بعد از رنک برین به مهمترین الگوریتم مناسب ساز نتایج گوگل تبدیل میشود.
همان طور که بررسیهای ما نشان میدهد هنوز این موج به فارسی نرسیده است و ابتدا در انگلیسی فعالیت خود را شروع میکند. اما کار این الگوریتم چیست.
شاید پیوند دانش زبان شناسی با علوم رایانهای در الگوریتم برت به اوج خود برسد. این الگوریتم به دنبال درک منظور آدمها از پرسشهایشان و جملاتشان در زبان گفتاری و نوشتاری است. این موضوع با تحلیل زبانشناختی روی میدهد. ما در رنک برین به دنبال آن بودیم که ارتباط کلمات را با یک دیگر برقرار کنیم. مانند لپه و گوشت با غذایی به نام قیمه، حالا اگر به دنبال درک یک جمله و ارتباط معنایی آن با یک پدیده باشیم چه؟ جواب این است که رنک برین به این موضوع هم میپرداخت و جملات را هم ارتباط یابی میکرد.تحلیلگران معتقدند برت یک راه جدید است که در کنار رنک برین به تحلیل عبارات میپردازد.
برت به دنبال درک منظور جملات است پس عبارتهای جستجو را هدف قرار میدهد. این واقعیتی است که سوالهای آدمها از گوگل بسیار زیاد شده است و همه ما تجربه سرچ کردن یک جمله سوالی یا یک جمله خبری را در گوگل داریم.
الگوریتم برت نتیجه یاد دادن بافت زبان به رایانه است
یک مثال فوق العاده در این زمینه وجود دارد که عملا گویای این ماجراست.
در زبان انگلیسی گاهی بجای آن که از کلمه without به معنی “بدون” استفاده کنند، از عبارت with on استفاده میکنند
آن گاه معنی ظاهری این جمله به این صورت میشود
“Parking on a hill with no curb”
“پارک روی تپه با نه محدودیت”
در حالی که منظور
“پارک روی تپه بدون محدودیت” بوده است
این روش گفتاری یعنی استفاده از نه برای اثبات عدم و وجود چیزی را ما در زبان نظامیها ایران هم میبینم آنجا که بجای کلمه وجود ندارد میگویند: “نه هست”
اما گوگل قبل از فعال شدن برت با این سوال گیج میشد و نتایج پارکینگ با محدودیت را میآورد و درک خاصی از ترکیب “با نه” نداشت.
این دو فیچر اسنیپت را که گوگل به عنوان نمونه آورده است را ببینید:
این که برت چگونه به این فرایند دست یافته و سازو کار الگوریتم چگونه است، هنوز چندان معلوم نیست. به خصوص که اساسا هنوز کار آن در فارسی فعال نشده است، اما حرف از آن است که گوگل ساختار NLP خود را از یک سال پیش به صورت کدباز در اختیار عموم قرار داده اما توانایی پردازش گوگل آن چنان است که گوگل را به یکی از معدود استفاده کنندگان از این الگوریتم بدل ساخته است.
آن چیز که کاملا برما معلوم گشته است این است که در آیندهای نچندان دور الگوریتم برت از هر 5 جستجو روی یکی از آنها تأثیر میگذارد. این عددی بسیار عظیم است و نشان از آن دارد که توان پردازشی بسیار قدرتمندی برای این الگوریتم در نظر گرفته شده است. شاید این خبر و خبر آزمایش کامپیوتر کوانتومی گوگل بیارتباط نباشند.
مقوله پردازش زبان طبیعی موضوعی است که تا به امروز به صورت عملی توسط هیچ ماشینی انجام نشده است. اما با رشد قدرت پردازش رایانهها این بخش نیز به زودی شاهد تحولاتی چشمگیر است.
بیشتر بخوانید: دوربین مداربسته دوربین مدار بسته دوربین مداربسته اصفهان دوربین مداربسته شیراز